那条外星讯息
❦
想象这样一个与我们相当相似的世界:由于基因筛选技术,平均 IQ 达到 140(按我们的量表计算)。潜在的 Einstein 不是百万里挑一,而是千里挑一;而且他们成长于一套虽未必专门为他们个人设计、但至少适合聪明孩子的学校系统中。微积分在六年级就是常规课程。Albert Einstein 本人依然活过、也依然作出了大致相同的发现,但他的工作已不再显得非同寻常。好几位现代一流物理学家都做出了同等级的突破,而且他们现在还活着,还能出来讲述。
(不,这并不是 Brennan 所生活的那个世界。)
有一天,夜空中的恒星开始发生变化。
有些变亮了。有些变暗了。大多数保持不变。天文望远镜把这一切逐时逐刻地记录下来。发生变化的恒星,其亮度变化是一颗一颗、明确分开的;亮度变化本身发生在一微秒之内,但每次变化之间相隔整整一秒。
从人们第一次意识到不止一颗恒星在变化的那一刻起,就已经很清楚:这一过程似乎尤其以地球为中心。那些散布在银河系各处恒星上的事件,其光抵达地球的时机,被精确地对准了地球在轨道上的位置。很快,来自高轨道望远镜的确认也到了(他们有那种设备):这些天文奇迹从地球外部看起来并不那么同步。只有地球上的望远镜会看到每秒有一颗恒星变化一次(准确地说,是每 1005 毫秒一次)。
地球上几乎全部汇集起来的脑力,都转向了分析。
人们很快发现,所有亮度跃升的恒星,都是精确地跃升到原来的 256 倍;所有亮度减弱的恒星,也都是精确地减弱到原来的 1/256。恒星坐标中看不出任何明显模式。因此,剩下来的,就只是一个亮—暗—亮—亮……的模式。
「一条二进制讯息!」这是所有人的第一反应。
但在这个世界里,也有一些极其谨慎、同样声望卓著的思想者,他们并不那么确定。「如果你能让恒星闪烁,而且你想通信,其实还有更简单的方法,」他们在博客上发文说,「某种东西正在发生。它看起来,乍看之下,尤其聚焦于地球。可把它称作一条『讯息』,就是对其背后原因作出了多得多的预设。也许在某种、呃、能够让恒星闪烁的东西之间,存在某类进化过程,而这个过程最终会以某种方式对智能变得敏感……是啊,其背后大概确实有某种类似『智能』的东西,但请试着体会一下,这实际上意味着多么宽广的一整片可能性。我们并不知道这是一条讯息,也不知道它是否出于那类会驱使我们去发讯息的动机。我是说,我们只会拿个大手电打信号,不会去把整条银河都折腾得乱七八糟。」
到这时,已经有人开始把天文数据汇总起来并发到互联网上。早先曾有人建议,这些数据也许有害;这个建议……并非被忽视了,但也没人照做。毕竟,若有某种强大到这种程度的东西想伤害你,那你基本上已经死了(人们如此推理)。
多个研究团队都在寻找恒星坐标中的模式——或者亮度变化相对于地心的分数到达时刻——或者亮度变化精确持续了多久——或者亮度变幅中的任何微小方差——或者恒星在变化前已知的其他任何事实。但大多数人都把注意力转向了那串明暗模式本身。
几乎转眼之间,人们就发现,这个发来的模式具有高度冗余性。前 16 个比特中,有 12 个是亮,4 个是暗。收到的前 32 个比特与接下来的第二组 32 个比特对齐后,只有 32 位里有 7 位不同;再下一组收到的 32 个比特,与第二组相比也只有 9 位不同(其中还有 4 位是先前就变过的位)。因此,从前 96 个比特中就已经可以看出,这个模式并不是对某种东西进行最优压缩后的编码。最明显的想法是:这串序列的作用,是传达接下来某条压缩讯息的解码说明……
「但是,」那些谨慎的思想者说,「任何在乎效率的人,如果拥有足以摆布恒星的力量,也许干脆就会拿个大手电给我们打信号,再给我们寄张 DVD?」
在这些 32 位分组内部,似乎也存在结构;某些 8 位子组出现的频率比另一些更高,而这种结构只出现在自然对齐处(32 = 8 + 8 + 8 + 8)。
在最初的 5 个小时、每秒 1 比特之后,又有一重冗余变得清晰起来:这条讯息大约从第 16,385 个比特开始重复自己。
把讯息拆成 32 位一组后,第 1 组和第 2 组之间有 7 位不同,而第 1 组和第 513 组之间有 6 位不同。
「一张二维图像!」所有人都这么想。「而且那四个 8 位组就是颜色;他们是四色视觉者!」
但人们很快发现,这里面存在横向/纵向的不对称:平均而言,(N, N + 1) 之间变化的比特数,比 (N, N + 512) 之间更少。如果这条讯息是一张投射到对称网格上的二维图像,你就不会预期这种现象。那样的话,你会预期两个 32 位分组之间的平均按位距离,应当随着网格分离的 2-范数而变化:h2 + v2。与此同时,人们还逐渐形成了一种普遍共识:把 8 位组编码成 −64 到 191 之间整数的某种二进制编码——不是那个在我们看来最显然的二进制编码,但依然高度规则——能够最小化相邻格点之间的平均距离。随着更多比特不断传入,这一点持续得到验证。统计学家、密码学家、物理学家和计算机科学家都投入了工作。这里面存在结构;它只需要被解开。那些因果性大师们,在比特与比特组之间搜寻条件独立、屏蔽(screening-off)和马尔可夫邻域。所谓的「颜色」在邻域与屏蔽关系中似乎扮演着某种角色,因此它不只是表面反射率的对应物。人们寻找能够预测或压缩这条讯息的简单方程、简单元胞自动机、简单决策树。物理学家甚至发明出整套全新的物理理论,试图描述那些也许被投射到网格上的宇宙——因为看起来,这样一条讯息完全有可能是从 Matrix 之外发来的。
当接收到 32 × 512 × 256 = 4,194,304 个比特、也就是大约一个半月之后,恒星停止了闪烁。
理论工作继续进行。物理学家和密码学家卷起袖子,认真地干了起来。他们曾用比这少得多的数据破解问题。物理学家曾凭粒子质量的微小差别检验整套理论大厦;密码学家也曾解开那些被刻意遮掩得更短的讯息。
岁月流逝。
在学界、在公众目光的审视下、也在那些曾做出 Einstein 级成果的科学家的检验下,有两种主导模型幸存了下来。一种理论认为,这个网格是来自五维空间中物体的投影,而其中 3 个空间维度与另外 2 个空间维度之间存在不对称。另一种理论则认为,这个网格意在编码某种元胞自动机——可以说,这个网格确实具备若干适合此事的性质。人们设计出了能产生有趣行为的编码;但到目前为止,在现有最大型计算机上运行相应自动机,仍未能产出任何可解码的结果。计算仍在继续。
时不时地,会有人找来一批格外聪明、且从未看过详细二进制序列的年轻学生。然后只给他们看最初的 32 行(每行 512 列),看看他们能否形成新的模型,以及这些新模型在预测后面 224 行时表现如何。无论是 3 + 2 维模型,还是元胞自动机模型,这些学生都已经能够很好地复现;但他们仍未做得更好。也有人构造出与整条序列精细拟合的复杂模型——但所有人都知道,那些大概毫无价值。
十年后,恒星再次开始闪烁。
在收到前 128 个比特之内,人们就看出:第二张网格可以拟合到所推断的 3 + 2 维空间中的微小运动,但它并不像任何一种主导性元胞自动机理论的后继状态。于是欢呼声四起,物理学家们开始着手归纳:究竟是哪一种动力学物理支配着在 3 + 2 维空间中所见到的那些物体。沿着这条方向的工作,其实早已做了很多——仅仅通过猜测:如果第一张网格中的那些物体是静止的,那么什么类型的平衡力能够产生它们;但现在看来,并不是所有物体都是静止的。正如大多数物理学家所猜测的那样——纯静态平衡的理论显得太牵强。
人们提出了许多漂亮的方程,来描述 3 + 2 维空间中的动力学物体如何被投影到第一张和第二张网格上。有些方程比另一些更优雅;有些方程在回头看来,对第二张网格的预测也更精确。某个由杰出物理学家组成的小组,把自己仔细隔离起来,只看了第二张网格的前 32 行,便写出了在他们看来十分优雅的方程——而这些方程在预测接下来的 224 行时也表现不错。于是,这成了主导性的猜测。
但这些方程仍然缺少规定;它们看起来还不足以构成一个宇宙。于是,一个小型产业兴起了:人们试图猜测,什么样的法则才能补完这些已经猜出来的法则。
当第三张网格在第二张网格十年之后到来时,它提供了关于二阶导数的信息,迫使人们对那套「不完整但很不错」的理论进行重大修订。不过总体而言,这套理论的表现也并不算太差。
第四张网格没有为整体图景增加太多内容。对于从网格中推断出的 3 + 2 物理学来说,三阶导数似乎并不重要。
第五张网格看起来几乎完全就是人们所预期的样子。
然后是第六张网格,第七张网格。
(哦,还有,在这个世界里,每次有人试图制造一个真正强大的 AI,计算硬件都会自发熔化。这对故事本身其实并不重要,但为了让真人们能以血肉之躯在七十年后仍然留在场上,我得加上这个设定。)
我的寓意?
那就是:即使是 Einstein,在高效利用感官数据这件事上,也远远称不上接近。
Riemann 在 Einstein 用上他的几何学之前,就已经发明了那些几何;而我们的宇宙物理,在绝对意义上并没有那么复杂。一个连着摄像头的贝叶斯超智能,在它看到苹果坠落的第三帧时,就会把广义相对论发明成一个假说——也许与牛顿力学相比,它还不是主导性假说,但也已经会是一个被直接纳入考量的假说。如果它看到的是一片弯曲草叶的静态形状,它甚至可能在第一帧时就猜到。
我们会想到这个。也就是说,我们的文明,只要能有十年时间去分析每一帧,就会想到。当然,如果平均 IQ 是 140,而且 Einstein 很常见,我们就更会想到。
即便我们是生活在另一种物理中的人类级智能——一种从未见过三维空间投影到二维网格上的心智——我们仍然会想到 3D -> 2D 这个假说。我们的数学家依然会发明向量空间和投影。
即便我们从未见过一颗正在加速的台球,我们的数学家也依然会发明微积分(例如用于优化问题)。
天啊,想想我们地球上已经发明出来的那些疯狂数学吧。
我偶尔会遇到一些人,他们会说这样的话:「给定有限数量的感官数据,你对外部世界所能推导出的东西,存在一个理论上限。」
对,确实有。这个理论上限是:每当你多看到 1 个比特,它所能期望消去的剩余假说,不能超过一半(更准确地说,是剩余概率质量的一半)。而一条冗余讯息,所能传达的信息也不可能超过它压缩版本本身。一个比特也不可能对某个量传达任何信息,如果在你所想象的那些可能世界中,它与那个量的相关性恰好为零。
但我所描绘的这个人类文明所做的一切,甚至连一点边都没有碰到 Solomonoff 归纳形式体系所设下的理论极限。它远远没有接近这样一幅图景:你可以搜索每一个可计算的假说,按其简洁性对它们加权,并对所有这些假说都进行贝叶斯更新。
要看见信息可提取量的理论极限,设想你拥有无限计算力,并且你去模拟所有拥有简单物理规律的可能宇宙,寻找那些其中嵌有地球——也许是嵌在某个模拟之中的地球——的宇宙;在这些宇宙里,存在某种过程,使恒星按所观察到的顺序闪烁。讯息中的任意一个比特——或者就此而言,对恒星的任意一种选择顺序——只要与环境中的任何元素存在最微小的一点相关性(跨越所有可能的可计算宇宙,并按简洁性加权),就会向你提供关于环境的信息。
如果照字面去理解,Solomonoff 归纳会创造出可数无穷多个被困在计算中的有感知生命。事实上,它会创造出一切可能的可计算有感知生命。这看起来显然不太合乎伦理。所以,幸好它只是一种形式体系。
但我要说的是,「你能从感官数据中提取多少信息的理论上限」,要远高于我所描绘的这个由物理学家与密码学家组成的文明所达到的胜利图景。
它当然绝不会像一个人看着苹果落下,然后心想:「呃,这为什么会发生?」那样。
人们似乎总会从「这是『有界的』」一跃跳到「这个界限一定是一个看上去挺合理、而且落在我熟悉尺度上的量」。超新星的功率输出也是「有界的」,但我可不建议你试图靠一件阻燃 Nomex 连体服来防御它。
没有人——哪怕是贝叶斯超智能——也永远不可能接近对自身感官信息进行高效利用……
……这是我想说的话,但我并不信任自己有能力去为贝叶斯超智能的能力设定上限。
(不过,要是有办法判定赌局结果的话,我愿意在这件事上押钱。只是不会押到极端离谱的赔率。)
故事继续:
几千年后,一帧又一帧地,我们终于看清:图像中的某些物体正伸出触手去移动其他物体,还会精心配置另外一些触手,摆出特定的符号。它们在试图教我们说出「石头」。
看来,发出讯息的那些家伙,严重低估了我们的智力。由此我们也许可以猜测,那些外星人自己并不算多聪明。那些笨手笨脚的小孩居然能够改变我们恒星的亮度?如此巨大的力量,配上如此程度的愚蠢,这种组合看起来相当危险。
我们的进化心理学家开始外推:什么样的进化路径,才会产生这样的外星人。一个很有力的论证认为,它们可能是以无性方式进化出来的,只在偶尔交换遗传物质和脑内容;这似乎是最可信的一条路线:如此愚蠢的生物居然还能建立起一个技术文明。它们的 Einstein 也许只相当于我们的本科生,但它们终究还是能收集到足够多的科学数据,把事情最终做成——也许得花上它们几万年的时间。
到这时为止,我们对于那个 3 + 2 宇宙的推断物理学还未完全知晓;但它看起来几乎可以肯定,允许建造比我们的量子计算机强大得多的计算机。我们相当确定,我们自己的宇宙正运行在这样一台计算机上的某个模拟中。人类决定不去探测这个模拟中的漏洞;我们可不想一个不小心把自己关掉。
我们的进化心理学家开始猜测那些外星人的心理,并规划我们该如何说服它们把我们放出盒子。这件事在绝对意义上并不难——它们并不聪明——但我们必须非常小心……
我们也得假装愚蠢;我们可不想让它们察觉到自己的错误。
不过,直到一百万年之后,它们才终于告诉我们该如何回信。
到了这个时候,人类物种中的绝大多数都处于液氦温度下、置于辐射屏蔽层之下的低温冷冻休眠之中。每次我们试图制造一个 AI,或者某种纳米技术装置,它都会熔毁。所以人类只能等待,沉睡。地球由一个仅有九名超级天才的骨干班子运转着。他们是已知能良好协作的克隆体,并受某些计算机安全措施监督。
在他们终于有机会慢慢开始实施那些亿万年前就制订好的计划之前,又有额外一亿名人类被生入那个骨干班子,成长、老去,然后进入低温冷冻休眠……
从外星人的视角来看,自从它们开始和我们说话以来,我们花了它们相当于三十分钟的时间,便极其天真无邪地了解了它们的心理;又极其小心翼翼地说服它们给我们互联网访问权限;接着又花了五分钟,天真无邪地发现了它们的网络协议,然后做了一点微不足道的破解——唯一的难点只是要把外表伪装得无辜一些。我们从它们相当于 arXiv 的地方,一比特一比特地读了极少量物理论文,从它们的实验中学到的东西,比它们自己学到的还多。(那一代地球骨干团队又额外培养出了 20 个 Einstein。)
然后,我们又花了大约一个世纪,破解了它们版本的蛋白质折叠问题,并在它们的模拟物理中做了一些模拟工程。我们给一些实验室发送信息(起初是隐写编码,直到我们破解的服务器把它解码出来),让它们去做相当于 DNA 测序和蛋白质合成的事情。我们找到某个毫不知情的倒霉蛋,给了它一个听起来合情合理的故事,再给它相当于一百万美元的、从计算系统里破解出来的垄断货币,并告诉它把邮寄来的几瓶试剂混在一起。于是,一些蛋白质等价物自组装成第一阶段纳米机器,第一阶段纳米机器造出第二阶段纳米机器,第二阶段纳米机器再造出第三阶段纳米机器……然后我们终于可以开始以一个像样的速度做事了。
从它们开始和我们说话算起,总共只过去了它们的三天。对我们来说,则是五亿年。
它们从未起过任何疑心。要知道,它们本来就不太聪明,哪怕还没把它们更慢的时间流速算进去。它们那种原始版的理性主义者四处说着这样的话:「你能从感官数据中提取的信息量,是有界限的。」而它们始终没能真正意识到,这意味着什么——意味着我们比它们更聪明,而且思考得更快。